Parámetros de “U/V Detection” de EVOC 20 TrackOscillator

El habla humana consta de una serie de sonidos de voz (sonidos tonal o formantes) y sonidos sordos. La principal diferencia entre los sonidos sonoros y sordos es que los sonidos sonoros se producen por una oscilación de las cuerdas vocales, mientras que los sonidos sordos se producen bloqueando y restringiendo el flujo de aire con los labios, la lengua, el paladar, la garganta y la laringe.

Si se usara habla con sonidos sonoros y sordos como señal de análisis de un vocoder, pero el motor de síntesis no distinguiera entre ambos sonidos, el resultado sería un sonido bastante débil. Para evitar este problema, la sección Synthesis del vocoder debe producir distintos sonidos para las partes sonoras y sordas de la señal.

EVOC 20 TrackOscillator incluye un detector sordo/sonoro. Esta unidad detecta las partes sordas del sonido en la señal de análisis y sustituye las partes correspondientes en la señal de síntesis con ruido, con una mezcla de la señal de ruido y sintetizador, o con la señal original. Si el detector U/V detecta partes sonoras, pasa esta información a la sección Synthesis, que usa la señal de síntesis normal para estas partes.

Breve introducción a los formantes

Un formante es un pico en el espectro de frecuencias de un sonido. En el contexto de las voces humanas, los formantes son los componentes clave que permiten a los humanos distinguir entre distintos sonidos vocálicos, tomando como referencia únicamente la frecuencia de los sonidos. El tracto vocal genera los formantes utilizados en el habla humana y al cantar; la mayor parte de los sonidos vocálicos contienen cuatro formantes o más.

Ilustración. Parámetros de “U/V Detection”.

Parámetros de “U/V Detection”